Séparation imprimé-manuscrit par étude de la linéarité et de la régularité du texte
نویسندگان
چکیده
RÉSUMÉ. Le but de cet article est de proposer une méthode pour la séparation entre manuscrit et imprimé dans des documents. La méthode proposée repose sur des descripteurs originaux appartenant à deux catégories différentes, la linéarité et la régularité, invariants à la translation et à l’échelle. Plus précisément, nous dérivons une mesure de linéarité à partir de l’histogramme des longueurs des segments. Le cadre résultant est indépendant de la forme du document et du type de langage latin utilisé, et fournit une approche numériquement efficace. Ses performances, évaluées sur des documents réels, atteignent un taux de reconnaissance qui dépasse 90%.
منابع مشابه
فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کاملInspiration nihiliste dans La Chouette aveugle de Sadegh Hedayat
La Chouette aveugle de Sadegh Hedayat, auteur iranien, qui appartient à la catégorie des œuvres dites « noires », se fonde sur une inspiration nihiliste. Malgré l’influence indéniable de la philosophie nihiliste dans la création de cette œuvre compliquée, il n’y a aucune étude cohérente qui traite ce sujet de différents points de vue. Ce qui est certain, c’est que Hedayat était un lecteur atten...
متن کاملContribution a l'etude du traitement de la morve experimentale du cobaye par l'anamorve, la sulfadiazine, la penicilline et la Streptomycine
متن کامل
Study of Domain Dependant Multi-Polarity Words for Document Level Opinion Mining (Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d'opinion au niveau du texte) [in French]
Résumé. Les méthodes de détection automatique de l’opinion dans des textes s’appuient sur l’association d’une polarité d’opinion aux mots des textes, par lexique ou par apprentissage. Or, certains mots ont des polarités qui peuvent varier selon le domaine thématique du texte. Nous proposons dans cet article une étude des mots ou groupes de mots marqueurs d’opinion au niveau du texte et qui ont ...
متن کاملARABASE : base de données Web pour l'exploitation en reconnaissance optique de l'écriture arabe
Nous proposons dans ce travail ARABASE une base de données d’images d’échantillons d’écriture arabe pour l’exploitation en reconnaissance optique de l’écriture (OCR-Optical Character Recognition). Cette base est implémentée sur un réseau à longue distance. L’étude des particularités morphologiques de l’écriture arabe, dans sa forme imprimée et manuscrite (en ligne et hors ligne), et les différe...
متن کامل